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"I think there's a world market for about 5 computers." 

(Thomas J. Watson, Chairman of the Board, IBM, circa 1948) 



"In the future, computers may weigh no more than 1.5 tonnes." 
- Popular mechantes, 1949 



"There is no reason for any individual to have a computer in his home." 
(Ken Olson, President, Digital Equipment Corporation, 1977) 
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Evolución de los computadores 





CRAY 1 


Lenovo T61 1 


Año (instalación) 


1976 


2008 


CPU 


Custom (circuitos discretos) 


Intel Core 2 Dúo T7300 (Merom) 




Procesador vectorial 


2 cores IA32 segmentado 


Características 


Sin Cache 


Lll (2x32KB) & LlD(2x32KB) + L2 (4MB) 




MP SRAM 


MMX, SSE(l,2,3,3S),EM64T,VT-x 


Consumo 


115.000 W 


100 W (CPU 35W) 


Dimensiones 


0:262,89 cm - 143,51 
Alt: 195,58-48,26 


3,0 x 34,0 x 24,0 cm 


Peso 


5.500 Kg 


2,5 Kg 


Coste 


8,86 millones dólares 


1.500€ 


Memoria 


8 MB 


2GB 


Disco 


2,5 GB(1 millón $, 1976) 


120 GB(50€, abril 2010) 


Rendimiento 


160 MFLOPS (pico), 
50 MFLOPS sostenido 


lOGFLOPS(linpack) 


Frecuencia 


80 MHz 


2 GHz 




Refrigerado con freón 


Portátil 




I ¡32años! 



¡32años! 




Tipos de computadores 







Servidor 




1 Embedded 


Coste del sistema 


500-5.000€ 


5.000-5.000.000€ 


5.000.000-????€ 


1-100.000€ 


Precio CPU 


50-500€ 


200-10.000€ 


200-2. 000€ 


0,01-100€ 


Puntos críticos 


Coste/rendimiento, 


Throughput, 


Rendimiento en 


Precio, consumo, 


en el diseño del 


rendimiento gráficos 


disponibilidad, 


coma flotante, 


rendimiento en 


sistema 




escalabilidad 


capacidad 


aplicaciones 








almacenamiento 


especificas 


Aplicaciones 


Ofimática, Ocio, 


Servidor web, Bases 


Geofísica, 


Teléfonos móviles, 




Estación de trabajo, 


de Datos, ... 


Meteorología, 


Lectores BluRay, 




Desarrollo software 




Diseño de aviones 


Automóviles, ... 


#cores 


1-8 


8-10.000 


1.280-294.912 m 


1-80 


Memoria 


Gbytes 


Tbytes 


Pbytes 


Mbytes 


Disco 


Tbytes 


Pbytes 


Pbytes 


Gbytes 




Pesos y Medidas 



■ Hay un cierto desconcierto a la hora de utilizar los prefijos de Medida 



Nombre 


Símbolo 


2 X 










Kilo 


K 


2 io 


1024 


10 3 


1000 


2,4% 


Mega 


M 


2 20 


1048576 


10 6 


1000000 


4,9% 


Giga 


G 


2 30 


1073741824 


10 9 


1000000000 


7,4% 


Tera 


T 


2 40 


1099511627776 


10 12 


1000000000000 


10,0% 


Peta 


P 


2 50 


1125899906842624 


10 15 


1000000000000000 


12,6% 


Exa 


E 


2 60 


1152921504606846976 


10 18 


1000000000000000000 


15,3% 


Zetta 


Z 


2 70 


1180591620717411303424 


10 21 


1000000000000000000000 


18,1% 


Yotta 


Y 


2 80 


1208925819614629174706176 


10 24 


1000000000000000000000000 


20,1% 


Xenta/Xora/Bronto 


2 90 


125728285239921434169442304 


10 27 


1000000000000000000000000000 


25,7% 



■ Para los prefijos binarios existe la norma ISO/CEI, aunque no está suficientemente 
extendida. Por ejemplo, 2 20 se denomina Mebi y usa el símbolo Mi. 




Pesos y Medidas 



Problema: no todo el mundo quiere decir lo mismo cuando utiliza la misma palabra: 

■ Los Hercios (Hz) se miden en potencias de 10: un procesador a 1 GigaHercio (GHz) va a 
1.000.000.000 Hz. 

■ La velocidad de transmisión se mide en potencias de 10: un MP3 stream a 128 Kb/s transmite 
128.000 bits por segundo, una conexión ADSL de 12 Mb/s acepta un máximo de 12.000.000 bits 
por segundo. 

■ El ancho de banda de los buses también se mide en potencias de 10 

■ La Memoria RAM siempre se mide en potencias de 2: 1GB de RAM es 2 30 bytes de RAM. 

■ Los discos duros (HD) utilizan potencias de 10. 

• Un HD de 30GB tiene 30-10 9 bytes (aproximadamente 28-2 30 ). 

• No es marketing, sino tradición: la estructura física de los discos (platos, pistas, sectores) no 
tiene por qué ser potencia de 2. 

• Además, el SO suele indicar el tamaño del disco en potencias de 2. 

S Por tanto, si compramos un portátil con 1GB de RAM y 30 GB de HD, Windows nos dirá 
que tiene 1GB de RAM y 28GB de disco duro. 




Máquina Von Neumann 




John Von Neumann (matemático húngaro) "First Draft of a 
report on the EDVAC" contract n. W-670-DRD-492 Moore 
School of Electrical Engineering, University of Pennsylvania, 
Philadelphia, June 1945 



Memoria accesible por dirección. 
Las posiciones de memoria se pueden 
leer/escribir las veces que sean necesarias. 
Tanto los datos como las instrucciones se 
almacenan en memoria. 

No existe ninguna señal para diferenciar en 
memoria datos de instrucciones. 
Las instrucciones se ejecutan en secuencia. 
Existe un registro (PC) que apunta siempre a 
la instrucción en ejecución. 

Existen instrucciones explícitas para romper el 
secuenciamiento. 

Las instrucciones son imperativas, especifican 
cómo obtener los operandos, qué operación 
hay que realizar y dónde dejar el resultado. 
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Métricas para caracterizar un sistema informático: 

• Coste: 

S Tamaño del die (dado). 

S Complejidad: esfuerzo requerido en el diseño, validación y fabricación del procesador. 
S Coste ambiental y social. 

• Rendimiento: Inversa del tiempo que tarda en completarse una tarea. 

• Consumo: Energía consumida por unidad de tiempo (watios). Normalmente 
mayor rendimiento requiere mayor consumo. 

• Fiabilidad: Tiempo entre fallos/reparaciones. Sistemas tolerantes a fallos. 



Tecnología de Fabricación 



Tecnología utilizada: CMOS 
Elemento básico: el transistor 




Esquema básico de 
una puerta NOT 



La tecnología se identifica por la longitud de la puerta 
del transistor medida en micrómetros (|im, 10~ 6 m) o 
nanómetros (nm, 10" 9 m). 





10 |im 


Intel 4004 


3|xm 


Intel 8088 


1,5 p.m 


Intel 286 


l|xm 


Intel 386 


0.8 |xm 


Intel 486 


0.6 Jim 


Power PC 601 


| 0.35 Jim 


AMDK5 


] 0.25 |im 


Alpha 21264 


180 nm 


Pentium III 


130 nm 


AMD Athlon XP 


90 nm 


Pentium 4 


65 nm 


IBM Cell (PS3) 


45 nm 


IBM POWER 7 


32 nm 


Intel i7 


22 nm 


16 nm 


11 nm 
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Evaluación 


del 


coste 







Factor de yield: fracción de circuitos correctos 
Coste de un circuito integrado 



Coste de un circuito integrado = 



Coste del die + Coste de testeo + Coste de empaquetado y test final 
Yield final 



Coste del die (dado) 

Coste del waffer 



Coste del die = 



Dies per wafferxDie yield 



Dies per waffer (oblea) / Wafferar 



Dies per waffer = 



Area útil _ 


Tix(diametro/2) 2 




nxdiameter 


Diearea 


Diearea 




V2xDiearea 



—Compensación por los dies incompletos de los bordes 



Die yield 

^. . , , ... ,, . , , (. defectos por unidad de areaxdiearea^i a 
Die yield = Waffer yieldxl 1 + " 

• a = medida de la complejidad, se aproxima al número de máscaras críticas 



Latpncia 

LQICI IVilCI 


v Anrho 


de 


Banda 







■ LATENCIA: tiempo que transcurre entre la solicitud de un dato (a memoria por 
ejemplo) y la disponibilidad del mismo. Se mide en ciclos o unidades de tiempo (s). 

■ ANCHO de BANDA: número de bytes transmitidos por unidad de tiempo. Se mide en 
KB/s, MB/s, GB/s (siempre potencias de 10). 





Latencia 


I Ancho de Banda 


Memoria DDR3-1600 


8,75 ns(10" 9 s) 


12,8 GB/s 


Gigabit Ethernet 


190|LLS (10 6 s) 


1Gb/s 


Disco Duro SATA -600 


7 ms (10" 3 s) 


145 MB/s 




Latencia y Ancho de Banda 

• 

Barcelona 300 Km Zaragoza 



LATENCIA 

• Ping a www.unizar.es : 10 ms 

• Ferrari Fl (a 300 Km/h): 3.600 s 

• Camión Volvo FH16 (a 100 Km/h): 10.800 s 

ANCHO de BANDA 

•ADSL a 20 Mb/s: 2,5 MB/s 

• Ferrari Fl (transportando 1 HD de 1 TB): 277,8 MB/s 

• Camión Volvo FH16 (transportando 34.000 HD de 1 TB): 3,15 TB/s 
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Tiempo de respuesta (wall time) 

7s 

user |so| 1/0 |so| user | 

2s 0.5 s 3s 0.5 s ls 

• Tiempo de usuario: 3s 

• Tiempo de sistema: ls 

• Tiempo de CPU: 4s 

• Tiempo de respuesta: 7s 

• Throughput: 1 proceso/7 s = 0.14 procesos/segundo 
Productividad (throughput) = trabajo/tiempo 



user 


|so 


1/0 


so user 


9.5 s 






user so 


1/0 


so| user 



Throughput = 2 procesos/9.5 s = 0.21 procesos/segundo 



Métricas 


de 


Rendimiento 







Rendimiento de un procesador 

Número de instrucciones ejecutadas 



= Tiempo de ejecución = NxCPIxT c " 

Rendimiento ^ 



_ Tiempo de ciclo 



Número medio de ciclos por instrucción 

TTiempo ejecución => ¿Rendimiento 



1 _ tiempo _ instrucciones ^ ciclos ^ tiempo 
Rendimiento Programa Programa instrucción ciclo 



Métricas de Rendimiento 



Rendimiento de un procesador 

• Reducir el tiempo de ejecución => Se puede actuar en cualquiera de los 3 factores 




Compilador LM Organización Tecnología 



Otras métricas de Rendimiento 

• MIPS: Millones de instrucciones por segundo 

• MFLOPS: Millones de operaciones en punto flotante por segundo 



Métricas de Rendimiento 



Ley de Amdahl 

• Expresión formal del sentido común. 

• Si aplicamos una mejora, la ganancia obtenida depende de la fracción del tiempo original 
donde se usa esa mejora. 



ti 



T M Tiempo Mejora Rendimiento Original 
t2 

| To = ti + 12 

fm-To 



Tm = ti + t3 



Ganancia = — = 

T M (l-fm)T 0 +t3 



fm, fracción mejorada 
gm, ganancia de la fracción mejorada 



(l-fm) + fn/ 



t2 f m • TO 

gm = — = = 

t3 t3 



fm-To 
gm 



Métricas de Rendimiento 



Ley de Amdahl 

Ganancia = 



(l-fm) + fr V 



Para que la ganancia obtenida 
sea significativa (cercana a gm) 
fm ha de ser prácticamente 1. 



Calcular fm para que la ganancia sea gm/2 



_gm-2 



(l-fm) + ffV 





5 


10 


50 


100 


1000 




0,75 


0,88 


0,979 


0,984 


0,9989 




2,5 


5 


25 


50 


500 



Métricas 


de 


Rendimiento 





Ley de Amdahl 

• Regla de diseño: Optimizar el caso frecuente. 

• Ejercicio, ¿Qué ocurre cuando gm -> °°? 
1 



> Ganancia = 



(1-fm) 





0,2 


0,5 


0,75 


0,9 


0,99 




1,25 


2 


4 


10 


100 



• Pero no hay que mejorar excesivamente el caso común, incrementos modestos de fm son 
más efectivos que grandes mejoras en gm. 

• La ley de Amdahl se puede aplicar a múltiples situaciones. 



Comparación de Rendimientos 



Para comparar el rendimiento de 2 computadores usaremos el tiempo de ejecución: 

_ . ,_ , . T A > 1 => B es más rápido que A 

Ganancia (Speedup) = — 

T B < 1 => B es más lento que A 

• Si un programa P tarda 4,5 segundos en el computador A y 2 segundos en el computador B: 

T A 4,5 

Ganancia = — = = 2,25 =^> B es 2,25 veces más rápido que A, usaremos 2,25x 

• También podemos usar porcentajes: 
1 1 1-100 



S Una ganancia del 125% => B es 2,25 veces más rápido. 



Top500 




















Cray Inc. Cray USA 
UM Barcelona Supercomputing Center IBM Spair 
ES IBM Poughkeepsle Benchmarking Center IBM USA 




Cray XT5 QuadCore 






11.076 91.080 AMD x86_64 


Cray XT5 SixCore/QuadCore 


Open Solaris 




^| United Kingdom Meteorological Office IBM UK 




pSeries 575 




Forecasting 


^ IBM -Menester -BM U» 


ny 5.120 37.153 AMDx86_64 


Cluster Platform 4000 BL465c 






a"ZI"IZny Z G Z 

Banking IBM Netherla 


nds 5.592 32.278 Intel EM64T 






Datábase 


WETA Digital HP New Zea 


and 5.936 31.527 Intel EM64T 


QuadCore 

Cluster Platform 3000 BL 2x220 






Digital Media (J) IBM USA 
^ University of Reading IBM UK 


8.064 24.670 Intel EM64T 


Xeon QuadCore 




Gaming 



Ranking de los 500 supercomputadores más potentes del mundo. 
La lista se actualiza 2 veces al año: junio (ICS) y noviembre (SC) 
LINPACK es la aplicación utilizada para hacer este ranking. 



www.top500.org 



Datos de noviembre de 2009 




Consumo 



■ Potencia y Energía 

• Potencia es el trabajo realizado por unidad de tiempo 

• Energía = Integral de la potencia en el tiempo 




Potencia es el nivel de consumo 
Energía es el área (nivel-tiempo) 



• La Energía se mide en unidades de trabajo: julios 

• Potencia es la energía consumida por unidad de tiempo: watios (julios/seg) 

• Si la potencia es constante: Energía = Potencia xt 

• La Potencia es importante por razones de disipación térmica 

• La Energía consumida es importante por el coste (económico y/o ambiental) y/o 
para incrementar la duración de la batería que alimenta al computador. 

S Batería = Energía 




Consumo 

■ Energía y potencia eléctricas 

Potencia = I x V = amperios x voltios = watios 

Energía = Pxt = lxVxt = amperios x voltios x segundo = watios x segundo = julios 

■ La Potencia consumida por un circuito CMOS tiene 3 componentes: 

• Conmutación: debido a la conmutación entre niveles de tensión en la carga 
capacitiva efectiva de todo el chip. 

• Corriente de fugas: los transistores no son ideales. 

• Corriente de cortocircuito: los dos transistores del inversor están activos cuando 
la entrada cambia de tensión. 

■ La potencia debida a conmutación es la más importante, aunque la de fugas 
representa un porcentaje cada vez mayor debido a las reducidas dimensiones de los 
transistores. 



Consumo 



Potencia y energía de conmutación: 

Potencia = CxV 2 xf 
Energía = C x V 2 

siendo, 

• f, frecuencia 

• C, capacidad efectiva equivalente de todo el chip en 1 ciclo (faradios) 

• V, tensión de alimentación 



Potencia de fugas: 

Potencia defuga = l defuga xV 
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Métricas de eficiencia 



Eficiencia energética = - 



watio tiempoxwatio Energía consumida 



Aproximaciones según el tipo de computador 
V Portátiles (bajo consumo) — > 1/Energía = Duración de la batería 
S Supercomputadores (green 500) — > Mflops / W 



Green 500 



Forschungszentrum Juelich (FZJ) 

IBM - Rochester 

IDRIS 

Oak Ridge National Laboratory 
Telecommunications 
Logistics 
Data Center (A) 

Sandia National Laboratories / Natio 
Energy Laboratory 

Barcelona Supercomputing Center 



|RM QPACE SFB TR Cluster, PowerXCell 8i, 3.2 

GHz, 3D-Torus 
IBM Blue Gene/P Solution 
IBM Blue Gene/P Solution 
Cary Cray XT5-HE Opteron Six Core 2.6 GHz 

BladeCenter HS22 Cluster, Xeon QC GT 2.53 
IBM GHz, GigEthernet 

|R . . BladeCenter HS22 Cluster, Xeon QC GT 2.53 

GHz, GigEthernet 
|R . . BladeCenter HS22 Cluster, Xeon QC GT 2.53 

GHz, GigEthernet 

Sun Blade x6275, Xeon X55xx 2.93 Ghz, 
Sun Infiniband 

BladeCenter JS21 Cluster, PPC 970, 2.3 
IBM GHz, Myrinet 

|BM BladeCenter JS21 Cluster, PPC 970, 2.5 

GHz, Myrinet 
Hp Cluster Platform 4000 BL465c, Opteron DC 
2.4GHz, GigEthernet 



Germany 
USA 



Hong Kong 



University of Reading 
IT Service Provider (C) 

Ranking de los 500 supercomputadores más potentes del mundo ordenados 
según eficiencia energética (MFLOPS/watio). 
El supercomputador que más consume (top2 nov 2010): 6950 kW. 
Potencia contratada en un hogar estándar: 5,5 kW 

Potencia de ASCO 2: 1027,2 MW (los 500 supercomputadores del top500 
consumen todos juntos alrededor de 300 MW, nov 2010) 



,07 6950,6 
,58 127,22 
,58 127,98 
,58 177,05 
2444,94 
,37 683,59 
,00 215,6 
,03 1613,82 



www.green500.org 
Datos de noviembre de 2009 



Fiabilidad 



Métricas para caracterizar la fiabilidad: 

• Fiabilidad: tiempo de funcionamiento continuo sin fallos 

S MTTF = Mean Time To Failure 

• Tasa de fallos (Failure rate) 



MTTF 



Interrupción del servicio se mide como el tiempo medio necesario para 
restablecerlo 

S MTTR = Mean Time To Repair 
Tiempo medio entre fallos (Mean Time Between Failures) 

S MTBF = MTTF+MTTR 
Disponibilidad (availability): Fraccción del tiempo en que un sistema está 
funcionando. 



Availability = 



MTTF 



MTTF + MTTR 



p = 1 — e 



Fiabilidad 

■ El tiempo entre fallos se aproxima a una distribución exponencial donde: 

• p = probabilidad de que se produzca un fallo 

• X = 1/MTTF (failure rate) 

• x = tiempo transcurrido 

■ ¿Cómo calcular el MTTF de un sistema, dado el MTTF de los componentes? 

• Dados dos componentes con fallos independientes y distribución exponencial 

S Probabilidades de fallo p 1 y p 2 
S Tasas de fallo \ y A 2 

V Tiempos medios entre fallos MTTF a y MTTF 2 

• probabilidad de que se produzca un fallo es 1 - "probabilidad que no falle 
ninguno", o sea: 

p =1 - (1 - pjx (1 - p 2 ) = 1 - e" AlX xe" M = 1 - e" (Xl + Mx 

• Que sigue una distribución exponencial con X =X 1 +X 2 de donde se deduce que : 

i _ i i 

MTTF MTTR MTTF, 



Fiabilidad 



■ Ejercicio 

Sistema formado por: 

• 1 CPU (incluye placa base y memoria) MTTF = 1.000.000 horas 

• 2 Discos MTTF = 500.000 horas 

• 1 Fuente de alimentación MTTF = 200.000 horas 
Calcular el MTTF del sistema: 



■ La forma de mejorar la fiabilidad es mediante redundancia. 

■S En tiempo: Repetir un cálculo para comprobar si es erróneo 
■S En recursos: Disponer de componentes extra que reemplazan al que falla 
• Ver ejemplos páginas 26 y 27 de H&P 



